ایجاد روش هایی برای اندیس گذاری, جستجو و رتبه بندی صفحات برای موتور جستجوی معنایی در حوزه صفحات فارسی ict

پایان نامه
چکیده

با توجه به رشد روزافزون اطلاعات و دانش, حجم¬های بسیار بالا از این اطلاعات و دانش¬ها موجود می باشد که جستجو برای یافتن اطلاعاتی خاص در آن¬ها, به دلیل حجم¬های بالای آنها دیگر کار آسانی نمی¬باشد. همواره نیاز به سیستم¬هایی که بتواند اطلاعات مورد نیاز افراد را فراهم کند احساس ¬شده است. چالش¬های فنی در مسیر طراحی این گونه سیستم¬ها را می¬توان در دسته¬های کلی تقسیم¬بندی کرد. می¬توان به نحوه ذخیره سازی و بازیابی و همچنین نحوه ارتباط با کاربر, به عنوان دو مسئله مهم در طراحی این گونه سیستم¬ها اشاره کرد که هر کدام شامل مسائل زیادی نظیر شاخص¬گذاری, ذخیره-سازی, پردازش و ... است. در بسیاری از موارد تعامل خوبی بین کاربران و موتور های جستجوی وب برقرار نمی¬شود. دلیل اصلی این موضوع عدم استفاده از زبان مناسب و قابل فهم موتور جستجو توسط کاربر و همچنین عدم توانایی کاربر در بیان نیاز های خود است. یکی از راه¬کارهای حل این مشکل استفاده از تکنولوژی معنایی است که امکان استفاده از مفاهیم و ارتباطات آنها را نیز به سیستم می¬دهد . استفاده از این تکنولوژی نیز چالش¬هایی را به همراه دارد. از مشکلات این کار ارتباط مفاهیم با همدیگر و در نظر گفتن آنها در سامانه , عدم وجود ساختمان داده متناسب با این تکنولوژی , نحوه نمایش نتایج بر اساس ارتباطات معنایی و زبانی است که کاربر بتواند نیاز ها خود را با استفاده از آن زبان به خوبی بیان کند. همزمان با بکار¬گیری تکنولوژی معنایی سعی گردیده تا حدودی زبان مورد استفاده کاربر به عنوان زبان پرس و جو وهمچنین مفاهیم کلمات به زبان طبیعی کاربر نزدیک باشد. این تحقیق نیز در جهت مطالعه برای ایجاد موتور جستجویی با استفاده از تکنولوژی معنایی در حوزه صفحات فارسی ict می باشد. در این پروژه با توجه به امکانات موجود سعی در طراحی اولیه یک موتور جستجوی معنایی با استفاده از ساخت یک هستان شناسی بوده است. تمرکز بر روی ایجاد یک ساختمان داده و همجنین استفاده بهینه و انجام جستجوی معنایی با استفاده از این ساختمان داده است.

منابع مشابه

ایجاد خزشگر تاکیدی و هست شناسی برای موتور جستجوی معنایی در حوزه صفحات فارسی ict

گسترش بیش از حد وب، نیاز بر سامانه های بازیابی اطلاعات را بیش از پیش نموده است. یکی از این دست سامانه ها، که تحقیقات بسیاری را معطوف خود نموده است، موتور های جستجو هستند. رشد نماییِ استفاده از موتور های جستجو در میان کاربران وب به اندازه ای است که بسیاری حتی در انجام کار های روزمره، استفاد از آن را در اولویت قرار می دهند. این میزان رشد نمایان گر نیاز بر تمرکز بیش از پیش بر توسعه موتور های جستجوی...

بهینه‌سازی هسته‌های چندگانه در ماشین‌بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب‌آمیز

چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص‌گذاری آن‌ها، قابلیت جستجوی سریع اطلاعات را به کاربران می‌دهند. یکی از چالش‌های مهم در استفاده از این ابزار، صفحاتی هستند که از آن‌ها به‌عنوان صفحات فریب‌آمیز نام‌ برده می‌شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع ‌شده است که می‌توان به روش‌هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از رو...

متن کامل

بررسی عناصر ابرداده ای موجود در صفحات وب حاصل از جستجو در موتورهای جستجوی عمومی

در پژوهش حاضر 90 صفحه وب از طریق جستجو در موتورهای جستجوی عمومی (گوگل، یاهو، و ام اس ان) به عنوان نمونه انتخاب شدند و میزان حضور عناصر ابرداده ای (هسته دابلین و ابرنشانه های زبان نشانه گذاری فرامتن) در این صفحات و وجود رابطه معنادار بین حضور عناصر ابرداده ای و نوع موتور جستجو مورد بررسی قرار گرفت. نتایج، نشان دهنده حضور بسیار کم عناصر ابرداده ای هسته دابلین و ابرنشانه های زبان نشانه گذاری فرامت...

متن کامل

رتبه بندی کیفی موتورهای کاوش فارسی و غیر فارسی در بازیابی اطلاعات حوزه اسلام

هدف: هدف پژوهش حاضر تعیین رتبۀ کیفیِ محتوای صفحات وب بازیابی‌شده از موتورهای کاوش فارسی و غیرفارسی در حوزه اسلام است. روش‌شناسی: این پژوهش از نظر هدف کاربردی است و به روش پیمایشی‌ _ توصیفی انجام شده است. ابزار گردآوری داده‌ها، سیاهۀ ارزیابی محقق‌ساخته با چهار معیار و متشکل از گویه‌های عمومی و تخصصی است. روایی ابزار با نظر ...

متن کامل

دسته بندی صفحات وب برای پالایش

مسئل? حفاظت از اقشار آسیب پذیر جامعه در مقابل موارد ناهنجار در صفحات وب، موجب احساس نیاز به پالایش صفحات وب شده است. یکی از جنبه های پالایش صفحات وب که امروزه بیش از پیش مورد توجه قرار گرفته است، طبقه بندی صفحات بر اساس میزان خشونت آمیز بودن آن ها است. طبقه بندی در واقع نسبت دادن یک صفحه به یک یا چند موضوع از پیش تعیین شده با استفاده از الگوهای آموزش داده شده می باشد. سیستم با استفاده از یک سری...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023